首先,不要誤會,這邊講的Pandas不是指可愛的熊貓喔,Pandas是一個在Python裡幫忙進行數據處理和數據分析的一個非常好用的小套件,他讓我們在看表格類的資料時非常方便。
Pandas主要可以分為Series和DataFrame兩部分,Series是用來處理一行或一列的單項資料時用到的,而DataFrame則是處理二維的多項資料。
程式講解:
首先有一件用所有套件之前都要做的事情,就是要先導入套件集。
import pandas as pd
先來講一下一維的部分,假設一個pandas的一維陣列[1,2,3,4]
s = pd.Series([1, 2, 3, 4])
s
我們可以利用index與values屬性,取得series的陣列與值。
s[0]
查看陣列中最大值及最小值用max()和min()函數
print(s.min())
print(s.max())
查看陣列中的值,可以利用索引值來確認
s.index
s.values
二維的部分我們可以把他當作Python中的Excel
import pandas as pd
last_names = ['Connor', 'Connor', 'Reese']
first_names = ['Sarah', 'John', 'Kyle']
df = pd.DataFrame({
'first_name': first_names,
'last_name': last_names,
})
df
除此之外,Pandas也可以讓我們在Python中讀取一些不是.py檔或.ipynb的檔案,常見的有csv、excel、sql、json、html等檔案,但在讀資料之前需要先將檔案放進Python的程式路徑裡面。
pd.read_csv("檔名")